Amazon Novaのテキスト生成モデルについて調査してみた #AWSreInvent
こんにちは、@TakaakiKakei です。
2024年12月2日~12月6日(米国太平洋標準時)に開催されるAWS re:Invent 2024で発表された、Amazon Novaのテキスト生成モデルについて調査した内容をご紹介します。
前提
以下のテキスト生成モデルを対象に調査しました。
- Nova Micro
- Nova Lite
- Nova Pro
モデル比較には、AIモデルの比較情報を公開しているArtificial Analysisの執筆時点情報を適宜参照します。
料金について
オンデマンドの料金は以下の通りです。競合モデルと比較しても、かなりの低価格です。
models | Price per 1,000 input tokens | Price per 1,000 output tokens |
---|---|---|
Amazon Nova Micro | $0.000035 | $0.00014 |
Amazon Nova Lite | $0.00006 | $0.00024 |
Amazon Nova Pro | $0.0008 | $0.0032 |
Claude 3.5 Haiku | $0.0008 | $0.004 |
Claude 3.5 Sonnet | $0.003 | $0.015 |
Artificial Analysisのグラフです。左側にあるほど、低価格です。パワフルなモデルの位置づけのNova Proでも、Claude 3.5 Haikuよりも低価格なのは驚きですね。
速度について
Output Speed
こちらは、モデルがトークンを生成している間、一秒間に受信されるトークンの数を示す指標です。左側にあるほど、一秒間に受信されるトークン数が多いです。Nova Microは試したときも感じましたが、受信する情報量が多いです。o1-miniとの回答品質の差次第は、高速な回答が求められるユースケースで、Nova Microを使うケースが増えるかもしれません。また、Nova Proもこの比較によれば、上位10番以内に入るほど速いです。
Latency
こちらは、APIリクエストが送信された後、最初のトークン(またはトークンの一部)を受け取るまでの時間を秒単位で測定する指標です。Nova Microが圧倒的にレイテンシーが低いです。
コンテキストウィンドウ
See more information on any of our supported models
各モデルのコンテキストウィンドウです。コンテキストウィンドウが長いほど、より長いテキストを一度に処理できたり、会話の連続性が向上します。下記に情報をまとめました。
- Nova Micro: 13万トークン
- Claude 3.5 Haiku: 20万トークン
- Claude 3.5 Sonnet: 20万トークン
- Nova Lite: 30万トークン
- Nova Pro: 30万トークン
- Gemini 1.5 Flash: 100万トークン
- Gemini 1.5 Pro: 200万トークン
Gemini 1.5系には及びませんが、Nova LiteとNova Proは30万トークンという長いコンテキストウィンドウを持っています。
回答品質
Quality Evaluations
回答品質が最も高い位置づけにあるわけではありませんが、Nova Proは上位に位置づけられているので、回答品質は高い方と思われます。回答品質は言語やユースケースによって変わるので、もう少し検証してから判断したいと思います。
AWS公式ドキュメント
モデルの利用可能なリージョンを確認することができます。現在は、バージニア北部リージョンのみです。
AWS公式のユーザーガイドです。
through the Invoke API (InvokeModel, InvokeModelWithResponseStream) and the Converse API (Converse and ConverseStream)
Invoke APIやConverse APIから利用することができます。
宣伝)クラスメソッドでの生成AIサービスである、AI-Starterの社内開発環境でも、Converse APIを使って利用開始しています。
マルチモーダルでサポートされるコンテンツタイプや制限などの情報がまとまっています。開発の参考にどうぞ。
さいごに
Novaのテキスト生成モデルについて、Artificial Analysisの情報を参考に、料金、速度、コンテキストウィンドウ、回答品質の観点から調査しました。
- 料金: Novaシリーズは、競合モデルと比較して全体的に低価格であることがわかりました。特にNova Proがパワフルでありながらも、低価格であることが驚きです。
- 速度: Nova Microは非常に高速で、Nova ProもOutput Speedで上位10番以内に入る速さを誇っています。これは高速な回答が求められるユースケースで大きなアドバンテージとなります。
- コンテキストウィンドウ: Nova LiteとNova Proは30万トークンの長いコンテキストウィンドウを持ち、長い会話が必要なユースケースでも使いやすいでしょう。
- 回答品質: 特にNova Proは上位に位置づけられており、回答品質は高いと判断できます。ただし、言語やユースケースによって品質は変わるので、さらなる検証が必要です。
今後もNovaモデルの活用方法や新たな情報について、引き続き調査していきたいと思います。
それではまた!